สมาชิกกลุ่ม

สมาชิกคนที่ 1

ชื่อ: นายวิพุธ ภู่ทอง

รหัสนักศึกษา: 60070090

เวลาเรียน: อังคาร 13:30 - 16:30 น.

สมาชิกคนที่ 2

ชื่อ: นายธีรภัทร ไกรศรีสิริกุล

รหัสนักศึกษา: 60070183

เวลาเรียน: อังคาร 13:30 - 16:30 น.

โจทย์ปัญหา

  1. Marvel หรือ DC เขียนตัวละครมาแล้วเสียชีวิตไปมากกว่ากัน?
  2. เพศและฝั่งของตัวละครมีผลหรือแนวโน้มที่จะถูกเขียนให้เสียชีวิตมากน้อยเท่าไร?

ชุดข้อมูลที่ใช้จาก fivethirtyeight : comic_characters

ขั้นตอนการดำเนินการ

1.) โหลด Library

library(tidyverse)
## ── Attaching packages ────────────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse 1.2.1 ──
## ✔ ggplot2 3.1.0       ✔ purrr   0.3.1  
## ✔ tibble  2.0.1       ✔ dplyr   0.8.0.1
## ✔ tidyr   0.8.3       ✔ stringr 1.4.0  
## ✔ readr   1.3.1       ✔ forcats 0.4.0
## ── Conflicts ───────────────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
library(fivethirtyeight)
library(stringr)
library(ggthemes)

2.) ทดลองดูข้อมูล

comic_characters

3.) หาคำตอบ

3.1.) ดูว่าตัวละครจากค่ายหนังสือการ์ตูนทั้ง Marvel และ DC นั้นมีอัตราการเสียชีวิตเท่าไร

by_publisher <- comic_characters %>%
                count(publisher, alive) %>%
                filter(!is.na(alive))

by_publisher

3.2.) ดูปัจจัยอื่นอย่างเพศและฝั่งของตัวละคร ว่ามีอัตราการเสียชีวิตเท่าไร

by_sex <- comic_characters %>%
          count(sex, alive) %>%
          filter(!is.na(alive)) %>%
          filter((sex == 'Male Characters') | (sex == 'Female Characters'))

by_sex
by_align <- comic_characters %>%
            count(align, alive) %>%
            filter(!is.na(alive)) %>%
            filter(align == 'Bad Characters' | align == 'Good Characters' | is.na(align))
## Warning: Factor `align` contains implicit NA, consider using
## `forcats::fct_explicit_na`
by_align

4.) นำข้อมูลมานำเสนอ (Data Visualization)

4.1.) ใช้ Bar Chart

p1 <- ggplot(data=by_publisher, aes(x = publisher, y = n)) +
      # map "alive" of beverage to aes "fill"" of the bar
      geom_col(aes(fill = alive), position = position_fill()) +
      # flip coordinate
      coord_flip() +
      # add labels
      labs(x="", y="Characters", title="Comic characters status from each publisher (In percentage)")

p1

4.2.) ใช้ Bar Chart

p2 <- ggplot(data=by_sex, aes(x = sex, y = n)) +
      # map "alive" of beverage to aes "fill"" of the bar
      geom_col(aes(fill = alive), position = position_fill()) +
      # flip coordinate
      coord_flip() +
      # add labels
      labs(x="", y="Characters", title="Comic characters status by character gender (In percentage)")
 
p2

p3 <- ggplot(data=by_align, aes(x = align, y = n)) +
      # map "alive" of beverage to aes "fill"" of the bar
      geom_col(aes(fill = alive), position = position_fill()) +
      # flip coordinate
      coord_flip() +
      # add labels
      labs(x="", y="Characters", title="Comic characters status by character alignment (In percentage)")

p3

สรุปผล

1.)

จะสังเกตได้ว่า ทั้ง Marvel และ DC นั้นมีการเขียนให้ตัวละครเสียชีวิตในอัตราที่ใกล้เคียงกัน โดยอัตราการเสียชีวิตของตัวละครจาก Marvel อยู่ที่ 23.0% และตัวละครจาก DC อยู่ที่ 24.56%

p1

2.)

ต่อมาหากดูจากเพศของตัวละคร จะสังเกตได้ว่า อัตราการเสียชีวิตของตัวละครเพศชาย มีมากกว่าตัวละครเพศหญิงเล็กน้อย โดยตัวละครเพศหญิงมีอัตราการเสียชีวิตอยู่ที่ 19.9% และตัวละครเพศชายมีอัตราการเสียชีวิตที่ 25.21%

p2

สุดท้ายหากดูจากฝ่ายของตัวละครก็จะพบว่า ตัวละครที่ไม่อยู่ฝั่งใดฝ่ายหนึ่งหรือฝ่ายดี มีอัตราการเสียชีวิตน้อยกว่าตัวละครฝ่ายร้ายระดับหนึ่ง โดยตัวละครที่ไม่อยู่ฝ่ายใดฝ่ายหนึ่งมีอัตราการเสียชีวิตอยู่ที่ 19.61% ตัวละครฝ่ายดีอยู่ที่ 20.26% และตัวละครฝ่ายร้ายอยู่ที่ 28.42%

p3